Serengeti - Webbasierte Annotation semantischer Relationen

نویسندگان

  • Nils Diewald
  • Maik Stührenberg
  • Anna Garbar
  • Daniela Goecke
چکیده

Der Artikel stellt zum einen ein Annotationsschema für semantische Relationen vor, das für die Beschreibung eines deutschsprachigen Korpus für Training und Evaluation eines Systems zur Anaphernauflösung entwickelt wurde, zum anderen wird das webbasierte Annotationstool Serengeti beschrieben, das zur Annotation anaphorischer Relationen im Projekt A „Sekimo“ eingesetzt wird. Im Gegensatz zu anderen Annotationstools benötigt Serengeti keine lokale Installation, was den Einsatz an einer großen Anzahl von Rechnern erleichtert. Darüber hinaus implementiert Serengeti ein Mehrbenutzerkonzept, das sowohl Gruppen als auch einzelne Nutzer unterstützt und zugehörige Dateien und Annotationen verwaltet.

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Generierung semantischer Felder auf der Basis von Frei-Texten

den Anspruch, genau die gleichen Head/ModifierRelationen automatisch zu finden, wie durch menschliche Intuition. Auf die RelationenTypes bezogen müßte die Fehlerrate wesentlich kleiner sein, wenn nur die häufigen Head/Modifier-Relationen berücksichtigt werden. Die Behandlung der Konjunktionsrelationen (s. Abb. 3) wurden ebenfalls zum Zweck der Phrasennormalisierung entwickelt. Bei der Extraktio...

متن کامل

Web-based Annotation of Anaphoric Relations and Lexical Chains

Annotating large text corpora is a timeconsuming effort. Although single-user annotation tools are available, web-based annotation applications allow for distributed annotation and file access from different locations. In this paper we present the webbased annotation application Serengeti for annotating anaphoric relations which will be extended for the annotation of lexical chains.

متن کامل

Die Verwendung von GermaNet zur Pflege und Erweiterung des Computerlexikons HaGenLex

Dieser Beitrag soll am Beispiel des semantikbasierten Computerlexikons HaGenLex aufzeigen, wie GermaNet für die Pflege und Erweiterung anderer lexikalisch-semantischer Ressourcen eingesetzt werden kann. Ausgangsbasis ist dabei eine Lesartenzuordnung zwischen GermaNetund HaGenLexEinträgen, welche die Übertragung der sinnrelationalen Zusammenhänge von GermaNet auf HaGenLex erlaubt. Auf der Grundl...

متن کامل

Linguistische und semantische Annotation eines Zeitungskorpos

Zusammenfassung. Dieser Artikel beschreibt das Vorgehen beim automatischen inkrementellen Aufbereiten eines rohen Textkorpus mit linguistischer und semantischer Information. Es wird gezeigt, wie das Erkennen von Eigennamen hilft, die Wortartenkategorisierung und partielle syntaktische Analysen zu verbessern. Eine Evaluation über ca. 1’000 Sätze zeigt die Stärken und Schwachpunkte der verschiede...

متن کامل

Relationsextraktion durch Frequent Patterns in Dependency Graphen

Die Anzahl der Veröffentlichungen im biomedizinischen Sektor wächst exponentiell. Dies macht Verfahren notwendig, in der großen Menge von Publikationen (man spricht dabei von einem Korpus) relevante Informationen automatisch zu finden. Eine wichtige Aufgabe ist die Extraktion von Relationen zwischen biomedizinischen Entitäten. Typische Entitäten sind Proteine, Gene und Krankheiten und wichtige ...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

عنوان ژورنال:
  • JLCL

دوره 23  شماره 

صفحات  -

تاریخ انتشار 2008